Korpus: bul_news_2012_100K

Weitere Korpora

4.3.1.6 Sentences with the most frequent beginning

Near duplicates with the same beginning of 40 characters

Most frequent sentence beginnings
sentence beginning #
От Анди Дабилис за Southeast European Ti 7
Германският финансов министър Волфганг Ш 6
Допълнителни насоки за кандидатстване мо 5
Испания влезе в историята след 4:0 срещу 5
Желаещите трябва да попълнят формуляр за 5
Това заяви председателят на Европейския 5
От Линда Карадаку за Southeast European 4
Кандидатите трябва да са граждани на дър 4
Подробности можете да намерите на официа 4
Подробности можете да намерите на страни 4
Българските волейболисти загубиха с 1:3 4
Върховният представител на ЕС за външнат 4
От Мухамет Брайшори за Southeast Europea 3
Международният олимпийски комитет (МОК) 3
Такава е прогнозата на Националния инсти 3
Българският нападател беше в основата на 3
Председателят на парламента Цецка Цачева 3
Европейската банка за възстановяване и р 3
ЦСКА спечели заслужена победа с 1:0 над 3
Това е прогнозата за времето на Национал 3
possible near duplicates
s_id sentence
17240 От Анди Дабилис за Southeast European Times от Атина – 24.08.
38040 От Анди Дабилис за Southeast European Times от Атина - 17.08.
45396 От Анди Дабилис за Southeast European Times от Атина - 30.10.
51620 От Анди Дабилис за Southeast European Times от Атина – 03.10.
75918 От Анди Дабилис за Southeast European Times от Атина - 04.10.
86395 От Анди Дабилис за Southeast European Times от Атина - 13.08.
86924 От Анди Дабилис за Southeast European Times от Атина – 10.10.
1256 msec needed at 2018-02-04 01:00